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О корректности модификаций формулы Байеса” 
А. И. Долгов 


Утверждается недопустимость сравнения и совместной обработки условных вероятностей, вычисляемых с 
использованием известных модификаций формулы Байеса, учитывающих вполне определённое количество 
накопленных свидетельств. Данное утверждение обосновывается следующим образом. Ввиду неодинакового 
нормирования получаются результаты, приводящие к выводам, не соответствующим теоретико- 
вероятностным закономерностям. На примере конкретных исходных данных показано, что в случае исполь- 
зования традиционных формул отсутствует мультипликативный эффект: уменьшение апостериорных услов- 
ных вероятностей каждой из гипотез при мультипликативном накапливании свидетельств оказывается не- 
осуществимым. Предложены модификации формулы Байеса, учитывающие вполне определённое количество 
последовательно накапливаемых свидетельств, построенные с применением общего делителя, равного сум- 
ме значений всех нормируемых вероятностей, которые подлежат сравнению либо совместной обработке. В 
отличие от известных формул, ввиду корректного нормирования, получаются результаты, существенно бо- 
лее адекватные изначальным статистическим данным. 

Ключевые слова: условные вероятности, гипотезы, накопленные и накапливаемые свидетельства, норми- 
рование. 


Введение. Формула Байеса широко используется в теории вероятностей и статистике [1-9]. 
Весьма актуальным направлением применения формулы Байеса является разработка модифика- 
ций, обеспечивающих определение апостериорных условных вероятностей гипотез с учётом на- 
капливания свидетельств. 

Наиболее известны по крайней мере три различающиеся между собой модификации фор- 
мулы Байеса, предназначенные для оценки апостериорных условных вероятностей гипотез с учё- 
том накопленных свидетельств [2—4]. Две из них [3, 4] являются модификациями формулы Байеса 
с изменениями, обеспечивающими учёт мультипликативно накопленных свидетельств, а одна [2] 
соответствует рекуррентному применению формулы Байеса с пошаговым получением соотноше- 
ний, эквивалентных другой модификации [3]. 

Как показывает анализ, традиционно используемые модификации формулы Байеса, учи- 
тывающие мультипликативно накопленные свидетельства, не применимы для определения апо- 
стериорных условных вероятностей гипотез при мультипликативно накапливаемых свидетельст- 
вах, ввиду некорректности получаемых результатов. 

Для устранения выявленного недостатка решается задача построения модификаций фор- 

мулы Байеса, обеспечивающих учёт накапливаемых свидетельств с применением корректного 
нормирования. 
Исходные положения. В основу излагаемых далее утверждений положим известное определе- 
ние вероятности: «Чтобы количественно сравнивать между собой события по степени их возмож- 
ности, очевидно, нужно с каждым событием связать определённое число, которое тем больше, 
чем более возможно событие. Такое число называется вероятностью события» [5]. 

Судя по приведённому определению, понятие вероятностей введено, в основном, для 
сравнения между собой различных событий по степени возможности, количественно выражаемой 
соотношениями измеренных значений их вероятностей. 

С учётом сказанного целесообразно сформулировать представляющий объективную осно- 
ву теории вероятностей, но не нашедший необходимого отражения в современной учебной и на- 





* 
Работа выполнена в рамках инициативной НИР. 
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учно-технической литературе принцип сохранения отношений изначальных вероятностей: кор- 
ректная обработка вероятностей осуществима лишь при нормировании, выполненном с применением 


одного и того же нормирующего делителя, обеспечивающего равенство отношений нормированных 
вероятностей отношениям нормируемых изначальных априорных вероятностей. 

Изначальные вероятности — вероятности, характеризующие степень возможности всех вхо- 
дящих в генеральную совокупность рассматриваемых событий или их комбинаций, совместно опре- 
делённые априорно на основе объективных данных при условии учёта одних и тех же факторов. 

Из сформулированного принципа следует, что: 

— отношения нормированных вероятностей событий или их комбинаций, образующих 
полную группу, в любых случаях получаются с использованием одного и того же нормирующего 
делителя и должны быть равны отношениям нормируемых изначальных вероятностей; 

— сравнение и совместная обработка нормированных изначальных вероятностей событий 
или их комбинаций, принадлежащих разным полным группам, недопустимы, ввиду того, что такие 
вероятности получены с использованием разных нормирующих делителей. 

При нарушении сформулированного принципа искажаются сведения о степени возможности 
рассматриваемых событий или их комбинаций, и получаемые на основе искажённых сведений ре- 
зультаты и принимаемые решения оказываются неадекватными реальным статистическим данным. 

Следует исходить из того, что любые представляющие интерес для рассмотрения полные 
группы событий или их комбинаций выбираются из их генеральной совокупности субъективно. 
При этом в анализируемой предметной области (как в «дискретном куске действительности») 
рассматриваются только такие ситуации, при которых в результате опыта появляется хотя бы од- 
но из событий или их комбинаций, входящих в выбираемую полную группу. 

При определении условных вероятностей традиционно рассматриваются простые и ком- 
бинированные события. 

1) Простые (отдельно рассматриваемые) образуют полную группу {Н,,Н,,...,Н,} несовме- 
стных гипотез. При этом события характеризуются изначальными априорными вероятностями 
Р(Н,), Р(Н,),...Р(Н,), сумма которых равна 1. 

2) Комбинированные — в виде мультипликативных комбинаций, представляемых произве- 
дениями Н,Е,,Н,Е‚Е’,,..,Н,ЕЕ...Е„ простых событий — учитываемых гипотез №! (К = 1.....П) и 


свидетельств Е; (/= 1,...,/7), подтверждающих гипотезы. При этом вероятности комбинаций собы- 
тий определяются на основе предварительно полученных изначальных вероятностей — в частно- 
сти, вероятность Р(Н/ Е, ) комбинации простых событий Нк и Е, определяется как произведение 
известных изначальных априорных вероятностей —Р(Н,) и Р(Е, | Н), так как 
Р(Н,Е‚) =Р(Н,) Р(Е, | Н,) согласно теореме умножения вероятностей [5]. 

Анализ известных соотношений. Как известно, формула Байеса [5] может быть записана в 
виде 

Р(Н,)Р(Е|Н,) 


Р(Н, Е) =- р 
У РНОРЕН,) 


(1) 





где Р(Н‚) — априорная вероятность гипотезы (события-следствия) Н/ (К = 1....п); Р(Е |9) = 


априорная условная вероятность наличия свидетельства (события-причины) Е при возникно- 
вении события-следствия Н/. 
Нетрудно видеть, что выражением (1) представлена вероятностная доля Р(Н,)Р(Е |5) 


среди всех возможных комбинаций Р(Н,)Р(Е |) соответствующих К = 1,....П, указанных в 
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знаменателе рассматриваемого соотношения в соответствии с так называемой [5] формулой пол- 
ной вероятности Р(Е) = ХРАМ, )Р(Е| Я) 
Формула, использованная в публикации Нейлора [2], записывается в виде, более простом 
с точки зрения количества указываемых вычислительных операций: 
Р(Н,)Р(Е|Н,) 
Р(Н,)Р(Е|Н,) + Р(нен,)Р(Е |нен,)' 





РН, |Е)= (2) 


где Р(Е | неН,) — априорная вероятность наличия события-причины Е при невозникновении со- 
бытия-следствия Н/. 

В рамках традиционных допущений из формулы полной вероятности вида 

Р(Е|(Н, +неН,)) =Р(Н,)Р(Е]Н,) + Р(нен,)Р(Е | нен,) с учётом того, что при рассматриваемой 


м Ш 
полной группе несовместных гипотез неН, = >» Н, , следует, что 
1=КИ=К) 


РН, )Р(Е м, +Р(неН, ) Р(Е | нен, ) = ХР(НР(ЕН,). 
Таким образом, соотношением (2) также представлена вероятностная доля 
Р(Н,)Р(Е |5) среди указанных в знаменателе всевозможных комбинаций Р(Н,)Р(Е | со- 


ответствующих ( = 1,...,7. Другими словами, при традиционных допущениях в случае одного сви- 
детельства ЕЁ как в знаменателях, так и в числителях обеих формул (1) и (2) представлены экви- 
валентные выражения. 

Следует отметить, что в отличие от (1) в соотношении (2) используется значение 
Р(Е | нен,), которое при условии эквивалентности знаменателей может быть определено из 


уравнения: 
ХР(НЫР(Е | Н,)=Р(Н,)Р(Е м) + Р(неН,)Р(Е нен,), (3) 
при этом 
‚> РОДР(ЕН,). > РООРЕ)) 
Р(Е | нен, ) —_ 1=К=К) —_ К/К) 
Р(ненН,) 1-Р(Н,) 

В сущности, формула (2) была использована в публикации [2] как модификация формулы 
Байеса, весьма удобная для рекуррентных вычислений. Как отмечает автор публикации [2]", в 
случае накапливания свидетельств, вычислив апостериорную вероятность гипотезы Н/х для одного 


учитываемого свидетельства Ё, «мы забываем об этом, за исключением того, что априорная ве- 
роятность Р(Н) заменяется на Р(Н| Е)», а затем продолжается выполнение вычислений, «но с 


(4) 





учётом постоянной коррекции значения РН) по мере поступления новой информации» (свиде- 
тельств). 

В целях анализа корректности соотношений, традиционно применяемых для определения 
апостериорных условных вероятностей гипотез при накапливании свидетельств, вычислим с ис- 
пользованием формулы (2) апостериорные условные вероятности Р(Е Е двух гипотез при 


каждом одном свидетельстве, а также вероятности Р(Н, ЕЕ при двух свидетельствах на кон- 


кретном примере следующих исходных данных, характеризующих рассматриваемые значения ап- 
риорных вероятностей: 





* Цитируются фрагменты в переводе с английского языка на русский. 
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Р(Н,) = 0,3; Р(Е, | Н,) = 0,6; Р(Е, |Н,) = 0,5; 
Р(Н,) = 0,7; Р(Е, | Н,) = 0,8; Р(Е,|Н,) = 0,9. 
С учётом исходных данных, запишем используемые далее промежуточные значения: 
Р(Н,Р(Е, | Н,) = 0,18; Р(Н,)РКЕ, | Н,) = 0,15; Р(Н,)Р(Е, | Н,)Р(Е, | Н,) = 0,09; 


Р(Н, РЕ, | Н,) = 0,56; Р(Н,)Р(Е, | Н,) = 0,63; Р(Н,)Р(Е, | Н,)Р(Е, | Н,) = 0,504; 
2 2 2 
Х.Р(НОР(Е Н,) = 0,74; У. Р(НЮР(Е. Н,) = 0,78; У РАНЬР(Е! Н,)Р(Е,|Н,) = 0,594. 


Для упрощения вычислений будем исходить из того, что значение Р(Е, | нен,) является 


вычисляемым, приводящим формулу (2) к соотношению, тождественно эквивалентному формуле 
(1) Байеса: 
Р(Н,)Р(Е,|Н,) _ РН, )Р(Е,|Н,) 


п И Е Не ах , 5 
Р(Н,)Р(Е, |Н,) +Р(нен,)Р(Е, | нен, ) Х Р(Н,)Р(Е,|Н,) - 


Р(Н, Е ‚)= 


и, следовательно, 











при К=1 Р(Н, | Е,) = я = 0,243 и Р(Е, | Н,) = о = 0,192, 
при = 2 имеем Р(Н.| Е )= 98 = 0,757 и Р(н, | Е.) = "63 = 0,808. 
211 0,74 4076 


Теперь определим апостериорную условную вероятность гипотезы #/ при двух свидетель- 
ствах с учётом того, что КнеН,) = 1 - ИН) и в формуле (5) в порядке её рекуррентного исполь- 
зования при К = 1 априорная вероятность РМ!) заменяется на РН, | Е, ): 

Р(Н, Е, )Р(Е, Н,) 
Р(Н, Е, )Р(Е, |Н,) + (1- Р(Н, Е, ))Р(Е, | нен,) 


Подстановка вычисляемого в соответствии с (4) значения 





НЕЕ, = 


РН Р(Е М.) р(,)РКЕ, |,) 
5 РН) Р(Н,) 


11020 
приводит к принимающему соответствующее значение соотношению 
Р(Н,)Р(Е, | Н,) 
У Р(НОРКЕ, |, 
Р(Н)Р(ЕН,) 
У Р(НЬРКЕ, |н,) 





> 
Р(Е, |нен,) = == =Р(Е,|Н,) = 0,9, 





Р(Е, |Н,) 
Р(Н, ЕЕ.) ы 





Р(Н,)Р(Е, | Н,) 
У Р(НЬРКЕ, |н,) 








Р(Е, |Н,) + (1 РЕ, Н,) 


_  Р(НР(Е,|Н,)Р(Е,|Н,) _ 0,09 - 0152 

а, на Е 
Х РАН, РЕ, | Н,)Р(Е, | Н,) 0,594 
Р(Н,)Р(Е, | Н,)Р(Е, |Н,) _ 0,504 


Аналогично Р(Н, Е Е,)=-— 0,594 
Х.Р(Ы,)Р(Е |НА Р(ЕН,) “ 


= 0,848. 


Следует обратить внимание на то, что формула (2) в случае учёта т свидетельств приво- 
дит к довольно известной (см., например, [3, с. 284-285]) модификации формулы Байеса 
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Р(Н,)Р(Е, | Н,)Р(Е,| Н,)х...жР(Е„| Н,) 


РН, Е Е..-.Е„)=- , 
Х.Р(Н, РЕ, НО РЕ НожхРЕ |5, ) 


(6) 


учитывающей множество накопленных свидетельств. 

Из анализа результатов, полученных при каждом из двух рассматриваемых свидетельств и 
при их мультипликативной комбинации, имеем два следствия. 

Во-первых, при традиционно применяемых методах вычисления апостериорных условных 
вероятностей Р(Н, | Е‚) ‚ Р(Н,|Е,) и РН, |Е\Е‚) осуществляются с использованием разных нор- 
мирующих делителей, что исключает возможность их сравнения и совместной обработки. 

Во-вторых, при мультипликативном накапливании свидетельств отсутствует мультиплика- 
тивный эффект: 

— апостериорная условная вероятность гипотезы №, равная при одном свидетельстве 
Р(Н|Е‚) = 0,243 либо РН, | Е,) = 0,192, при переходе к двум свидетельствам уменьшилась до 
Р(Н,|Е\Е,) = 0,152, 

— апостериорная условная вероятность гипотезы #4, равная при одном свидетельстве 
Р(Н,|Е‚) = 0,757 либо РН, | Е›) = 0,808, при переходе к двум свидетельствам увеличилась до 
Р(Н,Е.Е,) = 0,848. 

Заключая сказанное, следует также отметить, что использование разных нормирующих 

делителей при изменяющемся количестве учитываемых свидетельств и несоблюдение мультипли- 


кативного эффекта присуще не только модификациям формулы Байеса (2) и (6), но и другой мо- 
дификации, имеющей [4] следующий вид: 





Р(Н,)Р(Е, | Н,)Р(Е, | Н,Е,) -...-Р(Е„ Н.Е, Е, -... Ета) 


Р(Н, | Е,Е,...Е„)=-— 
$. РАН.) РЕ, | Н,)РЦЕ, | НЕ, -...-Р(Е„|Н,Е, Е› ---. Е) 


Таким образом, традиционные методы оценки апостериорных условных вероятностей ги- 
потез, учитывающие накапливание свидетельств, ввиду того, что при нормировании таких веро- 
ятностей используются разные нормирующие делители, приводят к некорректным результатам: 
при мультипликативном накапливании свидетельств уменьшение апостериорных условных веро- 
ятностей каждой из гипотез (связанное с мультипликативным эффектом, соответствующим теоре- 
тико-вероятностным закономерностям) оказывается неосуществимым. 

Следует также обратить внимание на то, что с применением известных модификаций 
формулы Байеса оцениваются апостериорные условные вероятности гипотез при свидетельствах, 
накопленных в порядке их предварительно установленной нумерации, в то время как более ре- 
альными являются случаи, когда порядок поступления свидетельств является изменяемым. Это 
можно учесть при построении модификаций формулы Байеса с корректным нормированием. 
Нетрадиционное нормирование. Сравнение апостериорных условных вероятностей гипотез 
при неодинаковом (изменяемом) количестве свидетельств осуществимо в случае корректного 
нормирования с использованием не разных нормирующих делителей, а одного общего делителя 
4, равного сумме альтернативных выражений, указанных в числителях всех используемых соот- 
ношений, а следовательно, и сумме всех ранее использованных нормирующих делителей. 

Например, в случае рассмотренных априорных исходных данных, ввиду того, что норми- 
руемыми являются вероятности Р(Н,)Р(Е,|Н,), /=1 или /=2, и Р(Н,)Р(Е, Н,)Р(Е,|Н,), 
К= 1,...,2, нормирующий делитель выбирается равным 


Ч У Р(НОРЕДН,) + $ РНЕ, | Н,) + >. РАН Р(Е, | НЕЕ, | Н,). 
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Можно перейти к более простой записи нормирующего делителя. Если просуммировать 
слагаемые с сомножителями, представляющими вероятности альтернативных комбинаций свиде- 
тельств при гипотезе №, и раздельно просуммировать аналогичные слагаемые с вероятностями 
при гипотезе /ф с вынесением одинаковых сомножителей РН) за скобки, и затем полученные 
выражения сложить, то (при л = т = 2) 

9 = $ (РНЕ, | Н,) +Р(Е. | Н,) + РЕ, | Н,)Р(Е› | Н,)]) = 7) 


Е ы [РН | РЕ, |н,) + ПРЕ, | н, | 


С использованием общего нормирующего делителя, который при заданных конкретных 
исходных данных принимает значение 
д = 0,74+0,78+0,594 = 2,114, 
равное сумме ранее использованных знаменателей, естественно, получаем иные результаты: 
0,18 0,15 








Р(Н, |Е,)= ——^ = 0,085, Р(Н,|Е,) = —— = 0,071; 
114 Е а 

0,09 0,56 
Р(Н.| Е, Е,) = ——^ = 0,043; Р(Н, | Е.) = —^^^= 0,265; 
5 114 14 

0,63 0,504 
Р(Н,|Е,) = ——® = 0,298; Р(Н,| Е, Е,)= —2— = 0,238. 
Е) = 114 Е а 








Результаты вычислений, выполненных для рассматриваемого примера конкретных апри- 
орных исходных данных, подтверждают, что в случае нетрадиционного (корректного) нормирова- 
ния значения апостериорных условных вероятностей всех гипотез при мультипликативном учёте 
накапливаемых свидетельств могут только уменьшаться, что соответствует теоретико-вероятно- 
стным закономерностям. В частности, при заданных априорных исходных данных конкретно рас- 
сматриваемого примера апостериорные условные вероятности обеих гипотез при получении вто- 
рого свидетельства (ввиду мультипликативного эффекта) уменьшились: апостериорная условная 
вероятность гипотезы Я уменьшилась с 0,085 либо с 0,071 до 0,043, а прежде увеличившаяся 
вероятность гипотезы А уменьшилась с 0,265 либо с 0,298 до 0,238. 

Таким образом, на основе обобщения (7) может быть предложено корректное соотноше- 
ние для определения апостериорных условных вероятностей гипотез в случае изменяемого коли- 
чества и = 1,...,77 мультипликативно накапливаемых свидетельств: 


Е ы Р(Н,Р (Е, ||, )-„Р (Е, | Н, ) 


-, $ [Ре РЕ, | Нь) + У. Р(Е, | НЗР(Е, | Ни) ++ ПРЕ, Ы 


К=1 





РН, 





где Е, — первое поступившее свидетельство, ..., Е, 


‚ — ре поступившее свидетельство, причём 
ЕЕ ЕЕ: и ввиду того, что множество ЕЕ является подмножеством 


"ЕсаЕ ‚ Учитывается произвольный порядок поступления свидетельств. 


Соответствующая записанному соотношению рекуррентная формула при начальном зна- 
чении 


Р(Н,)Р(Е, |, ] 





Р(н, 





Е, |= п т 
[иное | Н,)- ХР, | Н,)Р(Е, | Н,) +... + | 1Р(Е, | и 


К= р 7 
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имеет вид: 


Г=Й 7=А 


р, 
Такая формула в отличие от прототипов, ввиду корректного нормирования, является су- 
щественно более адекватной изначальным статистическим данным. При этом в каждом шаге ре- 
куррентного процесса используется всего одна расчётная операция умножения. 
Заключение. Известные модификации формулы Байеса, используемые для вычисления апосте- 
риорных условных вероятностей несовместных гипотез с учётом того или иного количества муль- 
типликативно накопленных свидетельств, не применимы для определения апостериорных услов- 
ных вероятностей, учитывающих изменяемое количество последовательно накапливаемых свиде- 
тельств, так как, ввиду неодинакового нормирования, приводят к результатам, не соответствую- 
щим теоретико-вероятностным закономерностям. Сравнение апостериорных условных вероятно- 
стей гипотез при изменяемом количестве свидетельств осуществимо в случае корректного норми- 
рования с использованием не разных нормирующих делителей, а одного общего делителя, равно- 
го сумме значений тех нормируемых вероятностей, которые подлежат сравнению либо совмест- 
ной обработке. 





На |-2[® 





Па (Е. |) 
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ОМ СОВВЕСТМЕ$$ ОЕ ВАУЕ$ РОВМИГА” 
А. Т. Оо!9 оу 


Тре паат/ЬЙу оЁ {те сотрайоп апа соорегайуе ргосезхта о! пе сопа!опа!/ ргоба И #е5 са/сшаеа ий {те 
изе оЁ те Кпоитп уапаНоп$ оЁ Вауез юЮгти/а сопзАепптд а ие/!-аейпеа атоипЕ о! 1е асситиаеа емдепсез #5 
еяар/ред. Тб зЕйетепЕ 15 ди5НЙеа аз Ю/оис. Вие №0 !е ипедиа! погтайгавоп, {1е гезийз |еа@ тд Ю {те 
сопа|и$юп5 ттасЫта те ргобару-Ёеогейса! 1аи/ аге оатед. Тпе ехатр/ез о! е сопсгее тша/ аа 
5Пои/ {ПаЁ т Пе сазе оЁ итд Те гаопа! Ююптиаз, {пе тиНр/сайуе ейесЕ 15 ти/5$та. гедистд {те ро$епой 
сопаШопа! ргоБарИИЕ$ ог еасй ОР {пе Руроезез ипаег те ти@р/савуе асситшайпд емаепсез [5 ипГеа Е. 
Тре Вауемап югтша то@йсавоп$ аге отегеа. Тпеу ргомае а ие/-аейпеа диап Шу оЁ зедиепвайу асситиа йе“ 
еиаепсез соптгиеа пгоидН {те соттоп Мог иисВ 5 едиг/ Ю {Те 5ит оЁ 1е уашез оЁ а// погта!га Ме 
ргоба без ПаМе ю сотрайзоп ог соорегавуе ргосез$тд. [п сопёгазЕЁ юЮ {те ие/-кпоип юЮгти5, аие №0 Ше 
соггесЕ погтайгайоп, {Те гези!5 экгиИйсапйу тоге ааедиае ю те п/а! аН5Нсх аге обатеа, 

Кеуигога5: сопО опа! ргобар/Ие5, Руроезез, асситиа4 апа асситиайпд еуепсез, погта!гайоп. 





* Тпе гезеагсй 15 допе мин пе й’ате оЁ {не паерепаег* В&О. 
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